将word 转换为图片(word to pdf ->pdf to image)

介绍:

将word文档转换为图片,先将word 文档转换为pdf 文件,再将pdf 转换为图片。

一:将word 文档转换为pdf 文件

要先安装win32com,使用以下命令行。

pip3 install win32com

直接上代码

from win32com import client

word = client.DispatchEx("kwps.Application")
word.Visible = 0 #0 不显示wps程序
in_file = " inputfile.docx"
new_file = 'outputfile.pdf'
doc = word.Documents.Open(in_file)
doc.PageSetup.PaperSize = 7     # 设置word纸张大小, A3=6, A4=7 
doc.PageSetup.Orientation = 1     # 设置word页面方向, 竖直=0, 水平=1
doc.SaveAs(in_file)  # 文档保存
doc.Close()
doc = word.Documents.Open(in_file)
doc.SaveAs(new_file, FileFormat = 17)
doc.Close()
word.Quit()
print("成功")

二:将pdf转换为图片

将pdf转换为图片比较复杂,需要借助两个库,fitz 和 PyQt5.QtGui

将pdf 的某一页转换为图片:

import fitz
from PyQt5 import QtGui


fname = 'inputfile.pdf'  
try:
    doc = fitz.open(fname)
    page = doc.loadPage(1)  #获取pdf 的第二页,可使用循环将所有转换为图片。
    pagePixmap = page.getPixmap()
    # 获取 image 格式
    imageFormat = QtGui.QImage.Format_RGB888 
    # 生成 QImage 对象
    pageQImage = QtGui.QImage(pagePixmap.samples,pagePixmap.width, pagePixmap.height, 
            pagePixmap.stride, imageFormat)
    pageQImage.save('outputfile.jpg')
    print("成功")
except:
    print("错误")

提醒:1.上面的代码可以将pdf的某一页转换为图片,再加个循环就可以将所有pdf都转换为图片。

2. 转换出来的图片的分辨率会有点差,大概在 850*600 左右,对于一些数据可能会造成很模糊,暂时未找到提高分辨率的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zpeien

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值